【1041】变量之间到底是单项转化还是双向转化
我们知道,观察单位的某项特征就是变量,变量根据自身的属性又分为数值变量、等级变量和分类变量,众多统计书上说变量之间是可以转化的,但到底是单向转化,还是双向转化呢?目前存在两个观点,一是只能单向,另一就是可以双向转化。今天我们来看看到底是如何转化的!
(即将开班)
单向转化的观点是,变量只能从高级别变量向低级别变量转化,变量级别由高到低依次为数值变量-等级变量-分类变量。依次单向转化的观点就是只能从数值转化为等级,等级转化为分类,或者数值直接转化为分类。
如某人收缩压直接测定值为180mmHg,是数值变量;但按照高血压分级的定义,该人是三级高血压,此时等级变量为(三级高血压、二级高血压和一次高血压);如果按照需呀是否正常,又可以分为正常与不正常,此时就是分类了。
因此,变量从高级向低级转化是没问题的。争议之处是从低级望高级转化。
比如有个人,知道血压不正常,您是如何知道其是高血压还是低血压,如何知道其具体的血压值呢?貌似这是不可能的,确实按照这个思路是条死路。
但有人说,我们在构建模型的时候,比如将性别带入模型(定义男=1,女=2),那么此时不就是将分类变量转换为数值变量,有低级变为高级了吗?
还比如把高级职称、中级职称和初级职称,定义为1、2、3,不也是同样的道理吗?
貌似这种说法也没有问题,但有一点。此种变换只是为了适应构建模型的需要,变量本身并没有变成高级别。比如说数值变量是有单位的,上述代换的数值是没有单位的,并且也不能支持数学换算。比如男=1,女=2,此时1+2并不等于3。
松哥统计说
变量有三种,级别分高低,高者可变低,此乃真变换,变量属性特征同时变换;低级变高级,实乃伪变换,仅为适应模型构建!
但这种伪变换确实有非常大的价值,尤其在构建回归模型的过程中,能够比教分类变量(变换后需要设置哑变量),等级变量不同水平对因变量Y的影响!
精鼎原创,欢迎转发,未经允许,谢绝转载!
统计思维与统计理论系列[1]
【1037】SCI论文中Logistic回归模型“门当户对”原则,松哥心得推荐给您
【1030】没有比较就没有伤害,让咱们互相伤害吧,教你4大类统计伤害方法
【1019】方差分析P>0.05,两两比较LSD法P<0.05,这可咋整?
【1018】倾向性评分后数据,应该采用配对设计还是成组设计?
【1003】连续变量变成等级变量后,原来有意义的变量变得没意义了?
【1001】SCI论文中的P for trend是什么鬼?为什么高分文章经常采用呢
-------------------------------------------